智能论文笔记

Airway measurement by refinement of synthetic images improves mortality prediction in idiopathic pulmonary fibrosis

Ashkan Pakzad , Mou-Cheng Xu , Wing Keung Cheung , Marie Vermant , Tinne Goos , Laurens J De Sadeleer , Stijn E Verleden , Wim A Wuyts , John R Hurst , Joseph Jacob

分类：计算机视觉

2022-08-30

几种慢性肺疾病，例如特发性肺纤维化（IPF）的特征是气道异常扩张。计算机断层扫描（CT）上气道特征的定量可以帮助表征疾病进展。已经开发了基于物理的气道测量算法，但由于在临床实践中看到的气道形态多样性，因此取得了有限的成功。由于获得精确的气道注释的高成本，监督学习方法也不可行。我们建议使用感知损失通过样式转移进行综合气道，以训练我们的模型气道转移网络（ATN）。我们使用a）定性评估将ATN模型与最先进的GAN网络（SIMGAN）进行比较； b）评估基于ATN和SIMGAN的CT气道指标预测113例IPF患者死亡率的能力。与Simgan相比，ATN被证明更快，更容易训练。还发现基于ATN的气道测量值始终比IPF CTS上的SIMGAN衍生气道指标更强大。通过转化网络使用感知损失来完善合成数据的转化网络是基于GAN的方法的现实替代方法，用于用于特发性肺纤维化的临床CT分析。我们的源代码可以在https://github.com/ashkanpakzad/atn上找到，该源代码与Airquant的现有开放源气道分析框架兼容。

translated by 谷歌翻译

HTML版本

Optimising Chest X-Rays for Image Analysis by Identifying and Removing Confounding Factors

Shahab Aslani , Watjana Lilaonitkul , Vaishnavi Gnanananthan , Divya Raj , Bojidar Rangelov , Alexandra L Young , Yipeng Hu , Paul Taylor , Daniel C Alexander , Joseph Jacob

分类：计算机视觉 | 机器学习

2022-08-22

在COVID-19大流行期间，在COVID-19诊断的紧急环境中进行的大量成像量导致临床CXR获取的差异很大。在所使用的CXR投影，添加图像注释以及临床图像的旋转程度和旋转程度中可以看到这种变化。图像分析社区试图通过开发自动化的CoVID-19诊断算法来减轻大流行期间过度拉伸放射学部门的负担，该诊断算法是CXR成像的输入。已利用大量公开的CXR数据集来改善CoVID-19诊断的深度学习算法。然而，公开可用数据集中临床可获得的CXR的可变质量可能会对算法性能产生深远的影响。 COVID-19可以通过图像标签等图像上的非动物特征的算法来推断诊断。这些成像快捷方式可能是数据集特定的，并限制了AI系统的概括性。因此，了解和纠正CXR图像中的关键潜在偏差是CXR图像分析之前的重要第一步。在这项研究中，我们提出了一种简单有效的逐步方法，以预处理Covid-19胸部X射线数据集以消除不希望的偏见。我们进行消融研究以显示每个单个步骤的影响。结果表明，使用我们提出的管道可以将基线共证检测算法的精度提高到13％。

translated by 谷歌翻译

Using Adaptive Experiments to Rapidly Help Students

Angela Zavaleta-Bernuy , Qi Yin Zheng , Hammad Shaikh , Jacob Nogas , Anna Rafferty , Andrew Petersen , Joseph Jay Williams

分类：机器学习

2022-08-10

自适应实验可以增加当前学生从教学干预的现场实验中获得更好结果的机会。在此类实验中，在收集更多数据时将学生分配到条件变化的可能性，因此可以将学生分配给可能表现更好的干预措施。数字教育环境降低了进行此类适应性实验的障碍，但很少在教育中应用。原因之一可能是研究人员可以访问很少的现实案例研究，这些案例研究说明了在特定情况下这些实验的优势和缺点。我们通过使用Thompson采样算法进行自适应实验来评估学生在学生中提醒的效果，并将其与传统的统一随机实验进行比较。我们将其作为有关如何进行此类实验的案例研究，并提出了有关自适应随机实验可能或多或少有用的条件的一系列开放问题。

translated by 谷歌翻译

Bayesian Pseudo Labels: Expectation Maximization for Robust and Efficient Semi-Supervised Segmentation

Mou-Cheng Xu , Yukun Zhou , Chen Jin , Marius de Groot , Daniel C. Alexander , Neil P. Oxtoby , Yipeng Hu , Joseph Jacob

分类：计算机视觉 | 人工智能 | 机器学习

2022-08-08

本文涉及分割中的伪标记。我们的贡献是四倍。首先，我们提出了伪标签的新表述，作为一种预期最大化（EM）算法，用于清晰的统计解释。其次，我们纯粹基于原始伪标记，即Segpl，提出了一种半监督的医学图像分割方法。我们证明，SEGPL是针对针对2D多级MRI MRI脑肿瘤分段任务和3D二进制CT肺部肺血管分段任务的半监督分割的最新一致性正则方法的竞争方法。与先前方法相比，SEGPL的简单性允许更少的计算成本。第三，我们证明了SEGPL的有效性可能源于其稳健性抵抗分布噪声和对抗性攻击。最后，在EM框架下，我们通过变异推理引入了SEGPL的概率概括，该推论学习了训练期间伪标记的动态阈值。我们表明，具有变异推理的SEGPL可以通过金标准方法深度集合在同步时执行不确定性估计。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Correcting Mispronunciations in Speech using Spectrogram Inpainting

Talia Ben-Simon , Felix Kreuk , Faten Awwad , Jacob T. Cohen , Joseph Keshet

分类：机器学习

2022-04-07

学习一种新语言涉及不断比较语音作品与环境的参考作品。在言语获取的早期，孩子们进行了发音调整以符合他们的看护人的言论。一种语言的成年学习者调整他们的演讲以匹配导师参考。本文提出了一种合成产生正确的发音反馈的方法。此外，我们的目标是在保持演讲者的原始声音的同时产生校正后的生产。该系统提示用户发音短语。记录语音，并用与不准确音素相关的样品用零掩盖。该波形是对语音生成器的输入，作为具有U-NET体系结构的深度学习介绍系统实现，并经过培训以输出重建的语音。该训练集由未损坏的适当语音示例组成，并且对发电机进行了训练以重建原始的适当语音。我们评估了系统的性能在音素替代英语以及发音障碍儿童的最小对单词方面的性能。结果表明，人类听众稍微偏爱我们产生的语音，而不是用不同的扬声器的生产来平滑地替换音素。

translated by 谷歌翻译

Algorithms for Adaptive Experiments that Trade-off Statistical Analysis with Reward: Combining Uniform Random Assignment and Reward Maximization

Jacob Nogas , Tong Li , Fernando J. Yanez , Arghavan Modiri , Nina Deliu , Ben Prystawski , Sofia S. Villar , Anna Rafferty , Joseph J. Williams

分类：机器学习 | (统计)机器学习

2021-12-15

像汤普森采样等多武装强盗算法可用于进行自适应实验，其中最大化奖励意味着数据用于逐步为更多参与者分配更有效的武器。这些转让策略增加了统计假设试验的风险，鉴定武器之间的差异，当没有一个时，并且在真正是一个是一个时，武器的差异存在差异。我们为2臂实验仿真，探讨了两种算法，这些算法结合了统计分析的均匀随机化的益处，具有通过Thompson采样（TS）实现的奖励最大化的益处。首先，前两种汤普森采样增加了固定量的均匀随机分配（UR）随时间均匀传播。二，一种新的启发式算法，称为TS Postdiff（差异后概率）。 Ts Postdiff采用贝叶斯方法来混合TS和UR：使用UR分配分配参与者的概率是后部概率，即两个臂之间的差异是“小”（低于某个阈值），允许在存在时探索更多的探索很少或没有奖励获得。我们发现TS PostDiff方法跨多种效果大小进行良好，因此不需要根据真实效果大小的猜测进行调整。

translated by 谷歌翻译

The Effect of Model Size on Worst-Group Generalization

Alan Pham , Eunice Chan , Vikranth Srivatsa , Dhruba Ghosh , Yaoqing Yang , Yaodong Yu , Ruiqi Zhong , Joseph E. Gonzalez , Jacob Steinhardt

分类：机器学习

2021-12-08

显示过次分辨率化，导致在亚组信息的各种设置下在罕见的子组上的测试精度差。为了获得更完整的图片，我们考虑子组信息未知的情况。我们调查模型规模在多种设置的经验风险最小化（ERM）下最差组泛化的影响，不同：1）架构（Reset，VGG或BERT），2）域（视觉或自然语言处理）3）模型尺寸（宽度或深度）和4）初始化（具有预先培训或随机重量）。我们的系统评价显示，模型大小的增加不会受到伤害，并且可以帮助所有设置的ERM下的最差群体测试性能。特别是，增加预先训练的模型大小一致地提高水鸟和多液体的性能。当子组标签未知时，我们建议从业者使用更大的预训练模型。

translated by 谷歌翻译

Evaluation of automated airway morphological quantification for assessing fibrosing lung disease

Ashkan Pakzad , Wing Keung Cheung , Kin Quan , Nesrin Mogulkoc , Coline H. M. Van Moorsel , Brian J. Bartholmai , Hendrik W. Van Es , Alper Ezircan , Frouke Van Beek , Marcel Veltkamp

分类：计算机视觉

2021-11-19

异常气道扩张，称为牵引支气管扩张，是特发性肺纤维化（IPF）的典型特征。体积计算断层扫描（CT）成像捕获IPF中逐渐变细的丢失。我们假设气道异常的自动化量化可以提供IPF疾病程度和严重程度的估算。我们提出了一种自动化计算管道，系统地将气道树木从基于深度学习的气道分割中划分到其裂片和世代分支，从而从胸部CT获得气道结构措施。重要的是，透气阻止通过厚波传播的杂散气道分支的发生，并通过图表搜索去除气道树中的环，克服现有气道骨架算法的限制。在14名健康参与者和14名IPF患者之间比较了透气段（跨空间）和透气曲线曲线之间的逐渐变化。 IPF患者中，Airway interberering显着降低，与健康对照相比，Airway曲线曲调显着增加。差异在下叶中最大标记，符合IPF相关损伤的典型分布。透气是一种开源管道，避免了现有的气道定量算法的限制，并具有临床解释性。自动化气道测量可能具有作为IPF严重程度和疾病程度的新型成像生物标志物。

translated by 谷歌翻译

Toward Robust Autotuning of Noisy Quantum Dot Devices

Joshua Ziegler , Thomas McJunkin , E. S. Joseph , Sandesh S. Kalantre , Benjamin Harpt , D. E. Savage , M. G. Lagally , M. A. Eriksson , Jacob M. Taylor , Justyna P. Zwolak

分类：机器学习

2021-07-30

当前的量子点（QD）设备的自动传动方法在显示出一些成功的同时，缺乏对数据可靠性的评估。当自主系统处理嘈杂或低质量数据时，这会导致意外的失败。在这项工作中，我们为QD设备的强大自动调整提供了一个框架，该QD设备将机器学习（ML）状态分类器与数据质量控制模块结合在一起。数据质量控制模块充当“守门人”系统，确保只有国家分类器处理可靠的数据。较低的数据质量会导致设备重新校准或终止。为了训练两个ML系统，我们通过结合QD实验的典型合成噪声来增强QD仿真。我们确认，在状态分类器的训练中包含合成噪声可以显着提高性能，在测试实验数据时，准确性为95.0（9）％。然后，我们通过表明状态分类器的性能随着预期的数据质量而恶化，从而验证数据质量控制模块的功能。我们的结果为嘈杂的QD设备的自动调整建立了强大而灵活的ML框架。

translated by 谷歌翻译